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© Procede et dispositlf de synthese de la parole par addltion-recouvrement de formes d'onde. 



© La synthese de parole est effectu^e a partir 
^elements tels que des diphones. On effectue, au 
moins sur les sons vois^s des Elements sonores, 
une analyse par fen§trage sensiblement centre sur 
le debut de chaque reponse impulsionnelie du 
conduit vocal h 1'excitation des cordes vocales h 
I'aide d'une fenetre de filtrage presentant une ampli- 
tude decroissant jusqu^ z6ro aux bords de la fene- 
tre de largeur au moins Sgale a deux fois la pSriode 
fondamentale d'origine ou deux fois la p^rlode fon- 
damentaie de synthese, on replace les slgnaux re- 
sultant du fenetrage correspondant Si chaque 6le- 
ment sonore, avec un decalage temporel de ceux-ci 
<£egal a la perlode fondamentale de synthese, inM- 
jyjrieure ou superieure a la pSriode fondamentale d'ori- 
fOgine, suivant information prosodique concernant la 
N frequence de synthase, on effectue la synthase par 
^sommation des signaux ainsi d^cal^s. 
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ProcedS et dispositif de synthase de la parole par additiorvrecouvrement de formes d'onde. 



[.'invention concerne les procedes et dispositifs 
de synthase de ia parole ; elle concerne, plus 
particulierement, la synthase k partir d'un diction- 
naire d'elements sonores par d^coupage du texte k 
synthetiser en microtrames identifi^es chacune par 
un numero d'ordre d'element sonore correspondant 
et par des param&tres prosodiques (information de 
hauteur de son au d£but et a la fin de I'element 
sonore et duree de Tel^ment sonore). puis par 
adaptation et concatenation des elements sonores 
par une procedure d'addition-recouvrement. 

Les elements sonores stockes dans le diction- 
naire seront frequemment des diphones. c'est-&- 
dire des transitions entre phonemes, ce qui per- 
met, pour la langue frangaise, de se contenter d'un 
dictionnaire d'environ 1300 elements sonores ; on 
peut cependant utiliser des elements sonores diffe- 
rents, par exemple des syllabes ou meme des 
mots. Les paramfctres prosodiques sont determines 
en fonction de criferes portant sur le contexte : la 
hauteur de son qui correspond a I'intonation, de- 
pend de I'emplacement de ('element sonore dans 
un mot et dans la phrase et la duree donnee a 
I'element sonore est fonction du rythme de la phra- 
se. 

II faut rappeler au passage que les methodes 
de synthese de la parole se subdivisent en deux 
groupes. Celles qui utilisent un module math^mati- 
que du conduit vocal (synthase par prediction li- 
neaire, synthase k formants et synthase k transfor- 
mee de Fourier rapide) font intervenir une decon- 
volution de la source et de la fonction de transfert 
du conduit vocal et exigent en general une cin- 
quantaine d'opgrations arithmetiques par echantil- 
Ion numerique de la parole avant conversion 
numerique-analogique et restitution. 

Cette deconvolution source-conduit vocal per- 
met d'une part la modification de la valeur de ia 
frequence fondamentale des sons voisSs, c'est- 
a-dire des sons qui ont une structure harmonique 
et sont provoqu£s par vibration des cordes vocales, 
et d'autre part la compression des donnees repre- 
sentant le signal de parole. 

Celles qui appartiennent au second groupe de 
procedes utilisent la synthese dans le domaine 
tempore! par concatenation de formes d'onde. Cet- 
te solution a I'avantage de la flexibility d'emploi et 
de la possibility de reduire considerablement le 
nombre d'op^rations arithmetiques par ychantillons. 
En contrepartie, elle ne permet pas de reduire le 
debit n^cessaire k la transmission autant que les 
methodes basees sur un module mathematique. 
Mais cet inconvenient disparatt iorsqu'on recherche 
essentieilement une bonne quality de restitution 
sans etre gen§ par fa necessity de transmettre des 



donnyes sur un canal etroit. 

La synthese de parole suivant la presente in- 
vention appartient au second groupe. Elle trouve 
une application particuliferement importante dans le 

5 domaine de la transformation d'une chaTne ortho- 
graphique (constituee par exemple par le texte 
fourni par une imprimante) en un signal de parole, 
par exemple restitue directement ou emis sur une 
ligne tyiyphonique normale. 

ro On connait deja (Diphone synthesis using an 
overlap-add technique for speech waveforms 
concatenation, CHARPENTIER et al, ICASSP 1986, 
IEEE-IECEJ-ASJ International Conference on 
Acoustics Speech and Signal Processing, pages 2 

/5 015-2 018)un procede de synthase de parole k 
partir d'elements sonores utilisant une technique 
d'addition-recouvrement de signaux a court-terme. 
Mais il s'agit de signaux k court-terme de synthe- 
se, avec normalisation du recouvrement des fene- 

20 tres de synthese, obtenus par un processus tres 
complexe : 

- analyse du signal original par fen§trage synchro- 
ne du voisement ; 

- transformee de Fourier du signal a court-terme ; 
25 - detection d'enveloppe ; 

- homothetie de Taxe frequentiel sur le spectre de 
la source ; 

- pondyration du spectre modifie de la source par 
I'enveioppe du signal d'origine ; 

30 - transformee de Fourier inverse. 

La prysente invention vise notamment a fournir 
un procede relativement simple et permettant une 
reproduction acceptable de la parole. Elle part de 
I'hypoth&se qu'on peut considerer les sons voises 

35 comme la somme des reponses impulsionnelles 
d'un fiitre. stationnaire durant plusieurs millisecon- 
des, (correspondant au conduit vocal) excity par 
une suite de Dirac, c'est-&-dire par un "peigne 
d'impulsions". de fagon synchrone de la frequence 

40 fondamentale de la source, c'est-a-dire des cordes 
vocales, ce qui se traduit dans le domaine spectral 
par un spectre harmonique, les harmoniques etant 
espaces de la frequence fondamentale et ponderes 
par une enveloppe presentant des maxima appeies 

45 formants, dypendant de ia fonction de transfert du 
conduit vocal. 

On a dyj& proposy (Micro-phonemic method of 
speech synthesis, Lucaszewic et al, ICASSP 1987, 
IEEE, pages 1426-1429) d'effectuer une synthese 

so de parole ou la diminution de ia frequence fonda- 
mentale des sons voises, lorsqu'elle est necessaire 
pour respecter des donnyes prosodiques, est ef- 
fectuye par insertion de zeros, les microphonemes 
stockys devant alors obligatoirement correspondre 
k la hauteur maximale possible du son k restituer, 
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ou bien (brevet US 4 692 941) de diminuer de la 
meme maniere par insertion de zeros la frequence 
fondamentale. et d'augmenter celle-ci en diminuant 
la taille de chaque periode. Ces deux methodes 
introduisent sur le signal de parole des distorsions 
non negligeables lors de la modification de la fre- 
quence fondamentale. 

La presente invention vise k fournir un proced6 
et un dispositif de synthase k concatenation de 
formes d'onde ne prSsentant pas la limitation ci- 
dessus et permettant de fournir une parole de 
bonne qualite. tout en ne necessitant qu'un faible 
volume de calculs arithmetiques. 

Dans ce but, Pinvention propose notamment un 
procede caracterise en ce que : 

- on effectue. au moins sur les sons voises des 
elements sonores, un fen§trage centre sur le debut 
de chaque reponse impulsionnelle du conduit vocal 
a I'excitation des cordes vocales (ce debut pouvant 
etre memorise dans un dictionnaire) a I'aide d'une 
fenetre presentant un maximum pour ledit debut et 
une amplitude decroissant jusqu'a zero au bord de 
la fenetre. et 

- on replace les signaux fenetrSs correspondant k 
chaque element sonore avec un d^calage tempore! 
egal k la periode fondamentale de synthase a 
obtenir, inferieur ou superieur a la periode fonda- 
mentale d'origine suivant reformation prosodique 
de hauteur de la frequence fondamentale et on 
effectue une sommation de ces signaux. 

Ces operations constituent la procedure de re- 
couvrement puis addition des formes d'onde §!e- 
mentaires obtenues par fenetrage du signal de 
parole. 

En general, on utilisera des elements sonores 
constitues par des diphones. 

La largeur de la fenetre peut varier entre des 
valeurs inferieures et superieures a deux fois la 
periode d'origine. Dans I'exemple de mise en oeu- 
vre qui sera dScrit plus loin, la largeur de la fenetre 
est choisie avantageusement egale k environ deux 
fois la periode d'origine en cas d'augmentation de 
la periode fondamentale ou environ deux fois la 
periode finale de synthase en cas d'augmentation 
de la frequence fondamentale, afin de compenser 
partiellement les modifications d'Snergie dues au 
changement de la* frequence fondamentale, non 
compensees par une normalisation possible de 
r§nergie, tenant compte de la contribution de cha- 
que fenetre k I'amplitude des echantillons du signal 
numSrique de synth&se : dans le cas d'une. diminu- 
tion de la periode fondamentale, la largeur de la 
fenetre sera done infSrieure k deux fois la periode 
fondamentale d'origine. II est peu souhaitable de 
descendre au dessous de cette valeur. 

Du fait qu'il est possible de modifier la valeur 
de la frequence fondamentale dans les deux sens, 
les diphones sont memorises avec la frequence 



fondamentale naturelle du locuteur. 

Avec une fenetre de duree egale a deux perio- 
des fondamentales consecutives dans le cas voise, 
on obtient des formes d'onde elementaires dont le 

5 spectre represente sensiblement I'enveloppe du 
spectre du signal de parole ou spectre a court 
terme large bande -du fait que ce spectre est 
obtenu par convolution du spectre harmonique du 
signal de parole et de la reponse frequentielle de la 

to fen§tre, qui dans ce cas possede une largeur de 
bande superieure k la distance entre harmoniques- 
; la redistribution temporelle de ces formes d'onde 
elementaires donnera un signal possedant sensi- 
blement la meme enveloppe que le signal d'origine 

/5 mais une distance entre harmoniques modifiee. 

Avec une fenetre de duree superieure a deux 
periodes fondamentales, on obtient des formes 
d'onde elementaires dont le spectre est encore 
harmonique, ou spectre a court terme bande etroi- 

20 te -du fait que cette fois-ci la reponse frequentielle 
de la fenetre est moins large que la distance entre 
harmoniques- ; la redistribution temporelle de ces 
formes d'onde elementaires donnera un signal pos- 
sedant, comme le signal de synthase precedent, 

25 sensiblement la meme enveloppe que le signal 
d'origine a ceci pres qu'on aura introduit des ter- 
mes de reverberation (signaux dont le spectre pos- 
sede une amplitude moindre, une phase differente, 
mais la meme forme que le spectre d'ampiitude du 

30 signal d'origine), dont I'effet ne sera audible qu'au 
6e\k de largeurs de fen§tre d'environ trojs perio- 
des, cet effet de reverberation ne degradant pas la 
qualite du signal de synthese lorsque son amplitu- 
de est faible. 

35 On peut notamment utiliser une fenetre de 
Hanning, bien que d'autres formes de fenetre 
soient egalement acceptables. 

Le traitement defini ci-dessus peut egalement 
§tre applique aux sons dits sourds ou non voises, 

40 pouvant §tre representes par un signal dont la 
forme s'apparente k celle d'un bruit blanc, mais 
sans synchronisation des signaux fenetres : ceci a 
pour but d'homogeneiser le traitement sur les sons 
sourds et les sons voises. ce qui permet d'une part 

45 le lissage entre elements sonores (diphones) et 
entre phonemes sourds et voises, et d'autre part 
une modification du rythme. II se pose un problfe- 
me k la jonction entre diphones. Une solution pour 
ecarter cette difficult^ consiste a omettre I'extrac- 

50 tion de formes d'onde elementaires k partir des 
deux periodes fondamentales adjacentes de transi- 
tion entre diphones (dans le cas des sons sourds, 
les marques de voisement sont remplacees par 
des marques posees arbitrairement) : on pourra 

55 soit defintr une troisteme fonction d'onde eiemen- 
taire en calculant la moyenne des deux fonctions 
d'onde elementaires extraites de part et d'autre du 
diphone, soit utiliser la procedure d'addition-recou- 



3 



5 



EP 0 363 233 A1 



6 



vrement directement sur ces deux fonctions d'onde 
elementaires. 

^invention sera mieux comprise k la lecture de 
la description qui suit d'un mode particulier de 
mise en oeuvre de ['invention, donne k titre 
d'exemple non limitatif. La description se reffere 
aux dessins qui I'accompagnent dans lesquels : 

- la Figure 1 est un graphe destine k illustrer 
la synthase de la parole par concatenation de 
diphones et modification des parametres prosodi- 
ques dans le domaine temporel. conformement k 
I'invention ; 

- la Figure 2 est un schema synoptique 
montrant une constitution possible du dispositif de 
synthase, implants sur un calculates hote ; 

- la Figure 3 montre. k titre d'exemple, com- 
ment on modifie les parametres prosodiques d'un 
signal nature!, dans le cas d'un phoneme particulier 

- ies Figures 4A. 4B et 4C sont des graphi- 
ques destines k montrer des modifications spectra- 
les apportees a des signaux de synthase voises, la 
Figure 4A montrant le spectre d'origine, la Figure 
4B le spectre avec diminution de la frequence 
fondamentale et la Rgure 4C le spectre avec aug- 
mentation de cette frequence ; 

- la Figure 5 est un graphique montrant un 
principe d'attenuation des discontinues entre di- 
phones ; 

- la Figure 6 est un schema montrant le 
fenetrage sur plus de deux periodes. 

La synthese d'un phoneme est effectuee k 
partir de deux diphones stockes dans un dictionnai- 
re. chaque phoneme etant compose de deux demi- 
diphones. Le son "e" dans "periode" par exemple 
sera obtenu a partir du second demi-diphone de 
"pai" et du premier demi-diphone de "air". 

Un module de traduction orthographique pho- 
nStique et de calcul de (a prosodie (qui ne fait pas 
partie de I'invention) fournit k un instant donnS. des 
indications identifiant : 

- le phoneme k restituer. d'ordre P 

- le phoneme pr£c£dent d'ordre P-1 

- le phoneme suivant, d'ordre P + 1 

et donnant la duree k affecter au phonfeme P ainsi 
que les periodes au debut et k ia fin (Rgure 1). 

Une premiere operation d'analyse, qui n'est 
pas modifiee par Invention, consiste a determiner, 
par decodage du nom des phonemes et des indi- 
cations prosodiques. les deux diphones retenus 
pour le phoneme k utiliser et le voisement. 

Tous ies diphones disponibies (au nombre de 
1300 par exemple) sont memorises dans un dic- 
tionnaire 10 muni d'une table constituant le des- 
cripteur 12 et contenant I'adresse du d§but de 
chaque diphone (en nombre de blocs de 256 oc- 
tets) la longueur du diphone et le milieu du dipho- 
ne (ces deux derniers parametres etant exprimes 



en nombre d'Schantillons k partir du d£but) et des 
marques de voisement rep£rant le debut de la 
reponse du conduit vocal k I'excitation des cordes 
vocales dans le cas d'un son voise (au nombre de 

5 35 par exemple). Des dictionnaires de diphones 
r^pondant k ces criteres sont disponibies par 
exemple auprfes du Centre National d'Etudes des 
Telecommunications. 

Les diphones sont alors utilises dans un pro- 

w cessus d'analyse et de synthese schematise sur la 
Figure 1. On decrira ce processus en supposant 
qu'il est mis en oeuvre dans un dispositif de syn- 
thase ayant la constitution montree en figure 2, 
destine k §tre relie k un calculates h6te. tel que le 

is processeur central d'un ordinateur personnel. On 
supposera Sgalement que la frequence d'echantil- 
lonnage donnant la representation des diphones 
est de 16 kHz. 

Le dispositif de synthese (Figure 2) comporte 

20 alors une nrtemoire vive principale 16 qui contient 
un micro-programme de calcul. le dictionnaire de 
diphones 10 (c'est-a-dire des formes d'onde repre- 
sentees par des echantillons) ranges dans I'ordre 
des adresses du descripteur. la table 12 constituant 

25 le descripteur de dictionnaire. et une fenetre de 
Manning, £chantillonnee par exemple sur 500 
points. La memoire vive 16 constitue egalement 
memoire de micro-trame et memoire de travail. 
Eile est reliee par un bus de donnees 18 et un bus 

30 d'adresses 20 a un acces 22 au calculateur hote. 

Chaque micro-trame emise pour restituer un 
phonfeme (Rgure 2) est constitute, pour chacun 
des deux phonemes P et P + 1 qui interviennent 

- du nuntero d'ordre du phon&me. 

35 - de la vaieur de la periode au debut du phoneme, 
de la vaieur de periode k la fin du phoneme, et 

- de la duree totafe du phoneme pouvant §tre 
remplacee par ia duree du diphone pour le second 
phon&me. 

40 Le dispositif comprend encore, relies aux bus 
18 et 20. une unite de calcul locale 24 et un circuit 
d'aiguillage 26. Ce dernier permet de relier une 
memoire vive 28 servant de tampon de sortie soit 
vers le calculateur. soit vers un controleur 30 de 

45 convertisseur numerique/analogique 32 de sortie. 
Ce dernier attaque un fiitre passe-bas 34. generale- 
ment limite a 8 kHz, qui alimente un amplificateur 
de parole 36. 

Le fonctionnement du dispositif est le suivant. 

so Le calculateur hote (non represent^) charge les 
micro-trames dans le tableau reserve en memoire 
16, par l f intermediate de I'acc&s 22 et des bus 18 
et 20. puis il commande le debut de synthese a 
I'unite de calcul 24. Cette unite de calcul recherche 

55 le nunrtero du phonfeme courant P, du phon&me 
suivant P + 1 et du phon&me precedent P-1 dans le 
tableau de micro-trames, k I'aide d'un index me- 
morise dans la memoire de travail, initialisee a 1. 
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Dans le cas du premier phoneme. i'unite de calcul 
vient chercher uniquement les numeros du phone- 
me courant et du phoneme suivant. Dans le cas du 
dernier phoneme, elle vient chercher le num£ro du 
phoneme precedent et celui du phoneme courant. 

Dans le cas general, un phoneme est constitue 
de deux demi-diphones ; I'adresse de chaque di- 
phone est recherchSe par adressage matriciel dans 
le descripteur du dictionnaire par la formule suivan- 
te : 

numero du descripteur de diphone = 

numero du 1er phoneme + (num£ro du 2§me 

phoneme-1)"nombre de diphones 

Sons voises 

L'unite de calcul charge, en m£moire de travail 
16, I'adresse du diphone, sa longueur, son milieu 
ainsi que les trente-cinq marques de voisement. 
Elle charge ensuite. dans un tableau descripteur du 
phoneme; les marques de voisement correspon- 
dent a la deuxieme partie du diphone. Puis elle 
recherche, dans le dictionnaire de formes d'onde, 
la deuxieme partie du diphone. qu'elle place dans 
un tableau representant le signal du phoneme 
d'analyse. Les marques conservees dans le ta- 
bleau descripteur du phoneme sont decrementees 
de la valeur du milieu du diphone. 

Cette operation est repetee pour ia deuxieme 
partie du phoneme constitute par la premiere par- 
tie du deuxieme diphone. Les marques de voise- 
ment de la premiere partie du deuxieme diphone 
sont ajout£es aux marques de voisement du pho- 
neme et incrementees de ia valeur du milieu du 
phoneme. 

Dans le cas des sons voises, I'unite de calcul, 
a partir des parametres prosodiques (duree, perio- 
de debut et pSriode fin du phoneme) determine 
alors le nombre de periodes necessaire a la duree 
du phoneme, suivant la formule : 
nombre de p£riodes = 2*duree du phoneme / 
(periode debut + periode fin) 

L'unite de calcul range en mSmoire le nombre 
de marques du phoneme naturel, £gal au nombre 
de marques de voisement, puis determine le nom- 
bre de periodes k eliminer ou a ajouter en effec- 
tual la difference entre le nombre de periodes de 
synthese et le nombre de periodes d'analyse, diffe- 
rence qui est fixee par ia modification de tonalite a 
introduire a partir de celle qui correspond au dic- 
tionnaire. 

Pour chaque periode de synth&se retenue, 
I'unite de calcul determine ensuite la periode 
d'analyse retenue parmi les periodes du phonfeme 
k partir des considerations suivantes : 
- la modification de la dur6e peut §tre considSrSe 
comme la mise en correspondence, par deforma- 



tion de I'axe des temps du signal de synthese, des 
n marques de voisement du signal d'analyse et 
des p marques du signal de synthese, n et p etant 
des entiers predetermines ; 

5 - a chacune des p marques du signal de synthase 
doit etre associee la marque la plus proche du 
signal d'analyse. 

La duplication ou, au contraire, I'elimination de 
periodes egalement reparties sur tout le phoneme 

70 modifie la duree de celui-ci. 

It faut noter qu'on n'aura pas a extraire une 
forme d'onde elementaire k partir des deux perio- 
des adjacentes de transition entre diphones : Tope- 
ration d'addition-recouvrement des fonctions ele- 

ts mentaires extraites des deux dernteres periodes du 
premier diphone et des deux premieres periodes 
du deuxieme diphone permet le lissage entre ces 
diphones comme le montre la figure 5. 

Pour chaque periode de synthese. I'unite de 

20 calcul determine le nombre de points a ajouter ou 
a supprimer a la periode d'analyse en effectuant la 
difference entre cette derniere et la periode de 
synthese. 

Comme on I'a indique plus haut, il est avanta- 
25 geux de choisir la largeur de la fenetre d'analyse 
de la fagon suivante, illustree en Figure 3 : 

- si la periode de synthese est inferieure a la 
periode d'analyse (lignes A et B de la Figure 3), la 
taille de la fenetre 38 est le double de la periode 

30 de synthese ; 

- dans le cas contraire, la taille de la fen§tre 40 est 
obtenue en multipliant par deux la plus faible des 
valeurs de la periode d'analyse courante et de la 
periode d'analyse precedente (lignes C et D). 

35 L'unitd de calcul determine un pas d'avance- 
ment dans la lecture des valeurs de la fenetre, 
tabulee par exemple sur 500 points, le pas etant 
alors egal k 500 divise par la taille de la fenetre 
prec£demment calculee. Elle lit dans la memoire 

40 tampon de signal du phoneme d'analyse 28 les 
£chantillons de la periode precedente et de la 
periode courante, les pondere par la valeur de la 
fen§tre de Hanning 38 ou 40 indexSe par le nume- 
ro de rechantillon courant multiplie par le pas 

45 d'avancement dans la fenetre tabulee et ajoute, au 
fur et k mesure, les valeurs caiculees a la memoire 
tampon du signal de sortie indexe par la somme 
du compteur de Techantillon courant de sortie et 
de I'index de recherche des echantillons du phone- 

50 me d'analyse. Le compteur de sortie courant est 
ensuite incrtmente de la valeur de la periode de 
synth&se. 

55 Sons sourds (non voises) 

Pour les phonemes sourds, le traitement est 
analogue au precedent, except^ que la valeur des 
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pseudo-periodes (distance entre deux marques de 
voisement) n'est jamais modifiee : Termination de 
pseudo-periodes au centre du phonfeme dimmue 
simplement la duree de celui-ci. 

On n'augmente pas la duree de phonemes 
sourds, excepte par addition de zeros au milieu 
des phonemes "silence". 

Le fenetrage s'effectue par periode pour nor- 
maliser la somme des valeurs des fenetres appli- 
quees au signal : 

- du debut de la periode precedente h la fin de la 
periode precedente, le pas d'avancement dans la 
lecture de la fenetre tabulee est (dans le cas d'une 
tabulation sur 500 points) egal a 500 divise par 
deux fois la duree de la periode precedente ; 
• du debut de la periode courante a la fin de la 
periode courante. le pas d'avancement dans la 
fenetre tabulee est egal k 500 divise par deux fois 
la duree de la periode courante plus un ddcalage 
constant de 250 points. 

A ia fin du calcul du signal d'un phoneme de 
synthese, 1'unite de calcul range la derniere perio- 
de du phon&me d'analyse et de synthase dans la 
memoire tampon 28 qui permet la transition entre 
phonemes. Le compteur de Pechantillon courant de 
sortie est d£cremente de la valeur de la derniere 
periode de synthese. 

Le signal ainsi genere est envoye. par blocs de 
2048 echantillons. dans un de deux espaces me- 
moire reserves a la communication entre I'unite de 
calcul et le controleur 30 du convertisseur 
numerique/analogique 32. D&s que le premier bloc 
est charge dans la premiere zone tampon, le 
controleur 30 est active par I'unite de calcul et vide 
cette premiere zone tampon. Pendant ce temps, 
I'unite de calcul remplit une deuxi&me zone tam- 
pon de 2048 echantillons. L'unite de calcul vient 
ensuite alternativement tester ces deux zones tam- 
pons grace a un drapeau pour y charger le signal 
numerique de synthase h la fin de chaque sequen- 
ce de synthase d'un phoneme. Le controleur 30, 
en fin de lecture de chaque zone tampon, position- 
ne le drapeau correspondant En fin de synthese, 
le controleur vide la derniere zone tampon et posi- 
tionne un drapeau de fin de synthase que le cal- 
culateur hote peut lire via l'acc§s de communica- 
tion 22. 

L'exemple de spectre de signal de parole voise 
d'analyse et de synthese illustre en Figures 4A-4C 
montre que les transformations temporelles du si- 
gnal numerique de parole n'affectent pas I'envelop- 
pe du signal de synthese, tout en modifiant la 
distance entre harmoniques, c'est-i-dire la fre- 
quence fondamentaie du signal de parole. 

La complexity du calcul reste faible : le nombre 
d'opSrations par echantillon est en moyenne de 
deux multiplications et deux additions pour la pon- 
dSration et la sommation des fonctions eiementai- 



res fournies par I'analyse. 

L'invention est susceptible de nombreuses va- 
riantes de realisation et, en particulier, comme on 
Pa indique plus haut. une fenStre de largeur supe- 

5 rieure a deux periodes, comme le montre la Figure 
6, eventuellement de taille fixe, peut donner des 
resultats acceptables. 

On peut aussi utiliser le procede de modifica- 
tion de la frequence fondamentaie sur des signaux 

io numgriques de parole en dehors de son application 
a la synthase par diphones. 
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1. Procede de synthase de parole a partir 
d'eiements sonores (mots, syllabes, diphones ...) 
caracterise en ce que : 

- on effectue, au moins sur les sons voises des 
20 elements sonores, une analyse par fenetrage sensi- 

blement centre sur le debut de chaque reponse 
impulsionneiie du conduit vocal a ('excitation des 
cordes vocales h I'aide d'une fenetre de filtrage 
presentant une amplitude decroissant jusqu'k zero 
25 aux bords de la fenetre dont ia largeur est au 
moins egale & deux fois la periode fondamentaie 
d'origine ou deux fois la periode fondamentaie de 
synthase. 

- on replace les signaux resultant du fenetrage 
30 correspondant h chaque element sonore, avec un 

d£calage temporal de ceux-ci egal k la periode 
fondamentaie de synthase, inferieure ou superieure 
a la periode fondamentaie d'origine, suivant refor- 
mation prosodique concernant ia frequence fonda- 
35 mentale de synthase, 

- on effectue la synthase par sommation des si- 
gnaux ainsi decates. 

2. Procede de synthase de parole selon la 
revendication 1 , caracterise en ce qu'on realise un 

40 dictionnaire d'eiements sonores, par exempie de 
diphones, on decoupe le texte a synthetiser en 
micro-trames identifides chacune par le numero de 
ceiement sonore correspondant (diphone) et au 
moins une information prosodique, constituee au 

45 moins par la valeur de la frequence fondamentaie 
en debut et en fin d'eiement et par la duree de 
t'element. 

3. Procede de synthese de parole selon S'une 
des revendications 1 et 2, caracterise en ce que la 

so largeur de la fenetre est egale a deux fois la 
periode d'origine en cas de diminution de la fre- 
quence fondamentaie ou deux fois la periode finale 
de synthese en cas d'augmentation de la frequen- 
ce fondamentaie. 

55 4. Procede de synthase de parole selon Tune 
des revendications 1 & 3, caracterise en ce que la 
fen§tre est une fenetre de Hanning. 

5. Dispositif de synthese de parole par mise en 
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oeuvre du proceed selon la revendication 1 , carac- 
teris§ en ce qu'il comprend. relics k des bus 
(18.20) : une memoire vive principale (16) qui 
contient un micro-programme de calcul, un diction- 
naire de diphones (10) constitues de formes d'onde 
representees par des echantillons ranges dans I'or- 
dre des adresses d'un descripteur (12) de diction- 
naire, et une fenetre de Hanning echantillonnee, 
ladite memoire vive (16) constituant egalement me- 
moire de micro-trame et memoire de travail ; une 
unite de calcul locale (24) et un circuit d'aiguiliage 
(26) permettant de relier une memoire vive (28) 
servant de tampon de sortie soit vers Tunite de 
calcul, soit vers un controleur (30) de convertisseur 
numerique/analogique (32) de sortie attaquant un 
filtre passe-bas (34) qui alimente un amplificateur 
de parole (36). 
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